Autoimitación Temporal: Aprendizaje por Refuerzo Eficiente Descubre cómo Temporal Self-Imitation Learning (TSIL) optimiza tareas robóticas de largo horizonte usando la eficiencia temporal como señal de supervisión. 2026-06-19 · 2 min